# 导包
from bs4 import BeautifulSoup

# 待解析的html文件
html = """
    <html>
        <head>
            <title>黑马程序员</title>
        </head>
        <body>
            <p id="test01">软件测试</p>
            <p id="test02">2020年</p>
            < a href="/api.html">接口测试</ a>
            < a href="/web.html">Web自动化测试</ a>
            < a href="/app.html">APP自动化测试</ a>
        </body>
    </html>
"""
# 实例化
# markup: 表示带解析的html格式字符串或文件对象
# features: 表现带解析的文件特征(特定类型),如果是html文件,直接使用"html.parser"
bs = BeautifulSoup(markup=html, features="html.parser")

# 调用方法
# 1.获取标签:对象,标签名
print(bs.p) # <p id-"test01">软件测试</p>
# 2.获取标签属性值:对象.标签名.get("属性名")
print(bs.p.get("id"))
# 3.获取标签的文本信息:对象.标签名.string
print(bs.p.string)  # 软件测试
# 4.获取所有标签:对象.fing_all("标签名")
print(bs.find_all("p"))
































